撤稿日记:从借酒消愁到统计分析的潜在问题
海归学者发起的公益学术平台
分享信息,整合资源
交流学术,偶尔风月
作为科研工作者,撤稿想必是最不愿见到的情形。抛开学术道德和利益冲突层面上的问题,其他因素也可能导致这一结果。当这样的事情真得发生在自己头上,我们能否客观冷静地处理呢?德克萨斯大学奥斯汀分校的生态学家丹尼尔·伯尼克 (Daniel Bolnick) 就遭遇了这样的变故,而他的故事让我们对于统计分析工作有了更多的思考。
早在2009年,丹尼尔在期刊《Evolutionary Ecology Research》上发表了题为“Diet similarity declines with morphological distance between conspecific individuals”的文章。事隔多年,他认识到了以往工作中的重大问题,他错误地使用了由R编写的统计工具。他和同事无法再现当时的数据,最终选择主动联系期刊,要求撤稿。有趣的是,他将自己的经历写在了博客当中,而Retraction Watch的记者也就此对他进行了采访。
丹尼尔·伯尼克,德克萨斯大学奥斯汀分校
记者:对于你自己统计分析的错误,你提出了很有趣的解释:凭借目测,没觉得数据有什么意义。但当代入数值之后,尽管不太明显,却(错误地)显现出了重要性。所以你就发表了结果。这一经历是否让你感受到,相信自己直觉的重要性?或者说观察数据时的“目测”结果?
丹尼尔:部分来说是的。但实际上,确实也会有微弱但颇具重要性的情况。真正的趋势可能需要在进行相当的变量控制下才会显现,所以y~f(x)的函数图就像是霰弹枪打出来的,只有引入变量z的时候,y才能够依赖于x而变化。换言之,二维图表可能无法捕捉真正的趋势。所以我仍然认为,我们的眼睛虽然有用,但不足以提供判断的充分依据。这也是我们为什么会研究统计学。我们需要做出正确的统计分析。
记者:所以你当初认为的结论——表型相似的动物有着相近的饮食——变成了错的。这是否让你觉得很惊讶?
丹尼尔:没错,这让我非常吃惊。尽管目测没有看出什么,但我确实在潜意识里倾向于接受那种“重要的”趋势,因为我真心地希望结果是这样。实际上,我仍然相信这个假设,但这需要我在饮食测量和形态学方面做出更有效的工作。我也有其他数据,在其他杂志发表过文章,这些都让我强烈地认为那种现象是对的,即便它通过这种特殊的方法,在这个群体或者年代中没有出现。
记者:这是你的第一次撤稿吗?有什么感想?
丹尼尔:是的。我觉得很糟糕,情绪非常消沉,那天晚上完全没睡好觉。不过当我发现了错误后,立即联系了期刊。正式的撤稿声明登在了下一期杂志中。
借酒消愁,沉浸在R代码的悲痛中
记者:我们注意到,期刊完全地删掉了这篇论文——这是有悖于出版伦理委员会 (Committee of Publishing Ethics) 的撤稿指南的。这是你决定写一篇博客的原因吗?
丹尼尔:并不是,我也有这篇文章的副本,任何人都可以来读它。
记者:你不仅介绍了自己的错误,还记录了最终的撤稿,这并不是你乐意干的事。如你所说:“提出撤稿毫无疑问地伤害了我的自尊心,写撤稿信很难受,但我视其为对自己的处罚。”多数学者不会在自己撤稿时写这样的公开博客,为什么你要这么做?
丹尼尔:这是一种补赎。如果在500年前,我可能会穿过城镇广场,鞭笞自己的后背。现在这样当然更文明,也好接受一些。实际上,写这篇博客最为有趣之处在于统计规范中的错误观念。要知道,R语言已经席卷并占领了生物学领域。时髦的学者都会用这个,我也总把自己视为R的铁杆用户。这次经验让我能够停下来思考。这确实是一个综合的教训。之所以发现问题,是因为我将R代码都保存了下来,能够追溯每一个分析决定的每个步骤,从而查找出错误。这是R的优势。但问题的出现在于,我像很多学者一样,并不是编写代码的专家,至少那时不是R的专家。所以对于R的过分信赖最终导致了这种错误的产生。我所学到的是,R是一把双刃剑,我们需要谨慎使用。这也是我希望告诫大家的,以避免未来的错误。
丹尼尔对文章所做的修正
记者:你提到其他学者也会出现类似的统计错误,这最好能在审稿过程中进行检查。不过你也承认,这不仅需要审稿人的时间,也需要他们具有专业能力。但实际上这很难做到,对此你有什么见解?
丹尼尔:从2018年1月开始,我将担任《The American Naturalist 》的主编,这是美国最古老的科学期刊。从实际的角度出发,你谈的问题确实说到点上了。目前来看,我们有这些障碍:
1. 并非每位学者在使用统计分析工具时都会记录下每一个步骤。鉴于这可能导致编程出现错误,我们无法要求大家都这么做。这意味着这很可能无法作为审查的强制性环节。
2. 任何要求提供这种标注良好的可重复代码,以便审稿过程参考的期刊,它们都将面对投稿量骤跌的局面。这需要在许多优秀期刊之间进行协商。
3. 如果我们要求审稿人审查R代码,那么他们要么会更多地拒绝审稿请求,要么就更多地粗略完成工作。况且很多优秀的审稿人并不懂得如何适当地审查代码。
可能的解决方案有这些:
1. 首先将这个要求定为自愿项目。为了激励学者们采用,我们会为通过代码审查的论文赋予特别的标记。作为读者,我将更信任具有这种标记的论文,也更愿意引用它。作者会乐于获得它,读者也会认可其价值。
2. 专门寻找一些能够进行代码审查的审稿人或编辑。这可能要和通常的审稿程序相区分,可能不需要主题相关的专业知识。最简单的办法就是雇人来做,同时向作者收取少量费用,使其文章接受代码审查,并获得认证标记。
3. 折衷的办法是要求在审稿和出版时,同时提供数据和相关代码。代码并不会接受正式的审查,但审稿人拥有审查的权力。这能够给作者带来一定威慑和激励,使其认真注释其代码并进行审校。这样做可能会存在一些问题。基本上这是把校对工作派回给了作者,不过我们能够使其比平时更用心地完成这一步骤。
参考资料
http://ecoevoevoeco.blogspot.ca/2016/12/wrong-lot.html
http://retractionwatch.com/2016/12/08/sinking-feeling-gut-diary-retraction/
本文为知社原创编译 ,媒体转载请联系授权
service@scholarset.com 或微信ID: scholarset
回复“目录”或“分类”,浏览知社更多精华。长按二维码识别,可以关注/进入公众号进行回复。